科研星球

Nature method IF=48!姚建华/原致远/张奇伟开发新的数据库,有利于空间组学数据的全面探索

空间组学技术可以生成丰富但高度复杂的数据集。

2023年2月16日,腾讯人工智能实验室姚建华、复旦大学原致远及美国德州大学张奇伟共同通讯在Nature Methods(IF=48)在线发表题为“SODB facilitates comprehensive exploration of spatial omics data”的研究论文,该研究表明SODB有利于空间组学数据的全面探索。该研究介绍了空间组学数据库(SODB),这是一个基于Web的平台,提供丰富的数据资源和一套交互式数据分析模块。SODB目前维护着>25空间组学技术的> 2400个实验,这些实验作为与各种计算包兼容的统一数据格式免费访问。

SODB还提供了多个交互式数据分析模块,特别是一个独特的模块,空间组学视图(SOView)。作者进行了全面的统计分析,并使用多个空间组学数据集说明了基本和高级分析模块的效用。该研究用大脑空间转录组数据证明了SOView的实用性,并恢复了已知的解剖结构。该研究进一步描述了相关标记基因的功能组织域,这些标记基因在使用以前的方法分析时被掩盖了。最后,该研究展示了SODB如何有效地促进计算方法的开发。

0.png

定量内源性空间背景下的分子剖面可以系统地了解组织组织。近年来,人们见证了各种空间技术的巨大进步,空间转录组学是最发达和应用最广泛的一类技术,可分为基于成像和基于下一代测序(NGS)。虽然能够实现全转录组分析,但经典的基于NGS的空间转录组学固有地存在有限的空间分辨率和低mRNA捕获率。基于成像的空间转录组学与基于NGS的方法具有一些互补优势,例如高空间分辨率和捕获率,但它们在要分析的目标基因数量和视野大小方面都受到限制。
在这方面,最近的一些工作,如HDST22, Slide-seqV2和Stereo-seq,已经通过改进各种限制被引入作为潜在的替代方案。空间蛋白质组学(SRHP)是另一类重要的空间技术,主要通过基于抗体的多路成像技术来实现。此外,空间代谢组学、空间基因组学和空间多组学都是新兴的空间技术,越来越受到人们的关注。
在文献中,上述所有能够实现多路分析的空间技术都被称为“空间组学”。由于这些技术进步,产生了大量的数据,以促进复杂生物空间生物学的全球研究。由于研究目的和来源不同,这些数据最初存放在不同的存储库平台上。一些数据保存在通用的数据库中,如Gene Expression Omnibus、Zenodo和figshare。大型联盟项目生成的其他数据存储在他们的Web服务器上,例如,人类肿瘤图谱网络(HTAN)用于不同人类癌症的三维(3D)图谱,免疫图谱构建和脑首创细胞普查网络(BICCN)脑细胞类型多组学图谱。商业公司生成的数据有时会作为样本数据集列在他们自己的网站上。这种异构的数据资源和表示方式对于普通研究人员来说,处理和利用工作量大,操作繁琐。
0 (1).png
SODB促进了计算方法的发展(图源自Nature Methods 
虽然已经提出了几个用于空间数据部署的数据库,并在线提供基本分析模块。然而,它们各自都有缺陷,如用户交互的限制、缺乏细胞类型/组织区域注释或缺乏新发布的数据类型/技术。重要的是,它们只专注于存储空间转录组学数据集,这意味着其他类型的空间组学技术,如空间蛋白质组学、代谢组学、基因组学和多组学数据被忽略了。
SODB提供了多种类型的空间组学数据集,数据格式可下载且统一,可直接输入到许多主流分析包中。除了数据,SODB还提供了一套交互式数据探索模块。其中,SOView是SODB的一个关键特性,它可以用于整体组织结构的可视化,并识别一些微妙但重要的局部或亚组织结构。SODB将综合空间组学数据与交互式分析模块集成在一起,通过提供组织水平分子剖面和生物学途径的多面视图,将极大地帮助其用户获得更多的功能见解。

原文链接:
https://www.nature.com/articles/s41592-023-01773-7


没有账号?